期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 面向语音增强的双复数卷积注意聚合递归网络
余本年, 詹永照, 毛启容, 董文龙, 刘洪麟
《计算机应用》唯一官方网站    2023, 43 (10): 3217-3224.   DOI: 10.11772/j.issn.1001-9081.2022101533
摘要131)   HTML4)    PDF (1993KB)(80)    收藏

针对现有的语音增强方法对语谱图特征关联信息表达有限和去噪效果不理想的问题,提出一种双复数卷积注意聚合递归网络(DCCARN)的语音增强方法。首先,建立双复数卷积网络,对短时傅里叶变换后的语谱图特征进行两分支信息编码;其次,将两分支中编码分别使用特征块间和特征块内注意力机制对不同的语音特征信息进行重标注;再次,使用长短期记忆(LSTM)网络处理长时间序列信息,并用两解码器还原语谱图特征并聚合这些特征;最后,经短时逆傅里叶变换生成目标语音波形,以达到抑制噪声的目的。在公开数据集VBD(Voice Bank+DMAND)和加噪的TIMIT数据集上进行的实验的结果表明,与相位感知的深度复数卷积递归网络(DCCRN)相比,DCCARN在客观语音感知质量指标(PESQ)上分别提升了0.150和0.077~0.087。这验证了所提方法能更准确地捕获语谱图特征的关联信息,更有效地抑制噪声,并提高语音的清晰度。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 解耦表征学习研究进展
成科扬, 孟春运, 王文杉, 师文喜, 詹永照
《计算机应用》唯一官方网站    2021, 41 (12): 3409-3418.   DOI: 10.11772/j.issn.1001-9081.2021060895
摘要1089)   HTML144)    PDF (877KB)(498)    收藏

解耦表征学习旨在对影响数据形态的关键因素进行建模,使得某一关键因素的变化仅仅引起数据在某项特征上的变化,而其他的特征不受影响,这有利于应对机器学习在模型可解释性、对象生成和操作以及零样本学习等问题上的挑战,因此解耦表征学习一直是机器学习领域的一个研究热点。从解耦表征学习的历史与动机入手,对解耦表征学习的研究现状以及应用进行归纳总结,分析了解耦表征所具有的不变性、复用性等特性,介绍了基于生成解耦表征变差因素的研究、基于流形相互作用解耦表征变差因素的研究、基于对抗性训练解耦表征变差因素的研究,以及一种变分自编码器β-VAE的研究等最新研究动态。同时,阐述了解耦表征学习的典型应用,并对未来的研究方向作出了展望。

图表 | 参考文献 | 相关文章 | 多维度评价
3. 伪标签置信选择的半监督集成学习视频语义检测
尹玉, 詹永照, 姜震
计算机应用    2019, 39 (8): 2204-2209.   DOI: 10.11772/j.issn.1001-9081.2019010129
摘要645)      PDF (1074KB)(302)    收藏
在视频语义检测中,有标记样本不足会严重影响检测的性能,而且伪标签样本中的噪声也会导致集成学习基分类器性能提升不足。为此,提出一种伪标签置信选择的半监督集成学习算法。首先,在三个不同的特征空间上训练出三个基分类器,得到基分类器的标签矢量;然后,引入加权融合样本所属某个类别的最大概率与次大概率的误差和样本所属某个类别的最大概率与样本所属其他各类别的平均概率的误差,作为基分类器的标签置信度,并融合标签矢量和标签置信度得到样本的伪标签和集成置信度;接着,选择集成置信度高的样本加入到有标签的样本集,迭代训练基分类器;最后,采用训练好的基分类器集成协作检测视频语义概念。该算法在实验数据集UCF11上的平均准确率到达了83.48%,与Co-KNN-SVM算法相比,平均准确率提高了3.48个百分点。该算法选择的伪标签能体现样本所属类别与其他类别的总体差异性,又能体现所属类别的唯一性,可减少利用伪标签样本的风险,有效提高视频语义概念检测的准确率。
参考文献 | 相关文章 | 多维度评价
4. 基于拓扑独立成分分析和高斯混合模型的视频语义概念检测
孔玮婷, 詹永照
计算机应用    2016, 36 (3): 770-773.   DOI: 10.11772/j.issn.1001-9081.2016.03.770
摘要544)      PDF (772KB)(440)    收藏
针对目前词袋模型(BoW)视频语义概念检测方法中的量化误差问题,为了更有效地自动提取视频的底层特征,提出一种基于拓扑独立成分分析(TICA)和高斯混合模型(GMM)的视频语义概念检测算法。首先,通过TICA算法进行视频片段的特征提取,该特征提取算法能够学习到视频片段复杂不变性特征;其次利用GMM方法对视频视觉特征进行建模,描述视频特征的分布情况;最后构造视频片段的GMM超向量,采用支持向量机(SVM)进行视频语义概念检测。GMM是BoW概率框架下的拓展,能够减少量化误差,具有良好的鲁棒性。在TRECVID 2012和OV两个视频库上,将所提方法与传统的BoW、SIFT-GMM方法进行了对比实验,结果表明,基于TICA和GMM的视频语义概念检测方法能够提高视频语义概念检测的准确率。
参考文献 | 相关文章 | 多维度评价
5. 基于概率超图的视频事件语义检测
任梅 詹永照 潘道远 孙佳瑶
计算机应用    2012, 32 (11): 3014-3017.  
摘要1026)      PDF (662KB)(555)    收藏
视频事件类别的归属具有模糊性和不确定性,将超图的点边射入矩阵拓展成概率形式的软超图进行关联关系分析和语义分析,将会更有利于提高多事件检索检测的精准率和召回率。提出基于概率超图模型的视频事件语义检测算法(PHVESD)。 该方法首先将颜色、灰度共生矩阵、Tchebichef矩、局部二值模式(LBP)等四种底层视觉特征进行融合; 然后定义视频段的亲密度函数并利用亲密度的信息构建概率超图模型,其中每条超边对应一种事件语义;采用随机游走过程来预测视频段属于每条超边的概率;最后结合阈值采用条件概率模型对视频段进行事件语义分类。将该方法用于交通突发事件多语义检测中并与其他的识别算法相比较,实验结果表明,与基于超图模型的多标签随机游走算法(MLRW)相比,PHVESD的算法使多语义事件检测的准确率提高了10%,召回率提高了8%。
参考文献 | 相关文章 | 多维度评价
6. 结合顶点趋势检测的三维模型数字水印算法
王新宇 詹永照
计算机应用    2011, 31 (10): 2665-2669.   DOI: 10.3724/SP.J.1087.2011.02665
摘要1089)      PDF (817KB)(555)    收藏
为了提高三维模型空域数字水印算法对抗各类攻击尤其是简化、剪切及其联合攻击的鲁棒性,提出一种新的结合顶点趋势检测的三维模型数字水印算法。利用三维模型顶点的球面坐标构建有序顶点集,选择体现三维模型整体形状信息的顶点范数嵌入水印;通过比较和统计待检测模型和原始模型顶点范数的变化关系,以变化趋势为依据实现水印检测,并分析顶点缺失率进一步弱化剪切对水印检测的影响。实验表明,该算法对各种常见的单一类型攻击如平移、旋转、均匀缩放、顶点重排序、噪声、简化、剪切、量化和细分以及联合攻击都具有较好的鲁棒性,对平滑攻击也有一定的抵抗能力,能够较好地应用于三维模型的版权保护。
相关文章 | 多维度评价
7. 基于对象模糊密度赋值的决策层融合算法
陈亚必 朱勇 詹永照
计算机应用    2010, 30 (4): 990-992.  
摘要1125)      PDF (734KB)(1211)    收藏
针对模糊积分在进行决策层融合识别时,其模糊密度是根据已知类别样本的先验静态信息赋值的,并不能根据具体对象的识别结果进行动态调整使之更接近现实的情形,提出了一种基于对象模糊密度赋值的决策层融合算法。该算法利用各分类器识别具体对象时给出的客观信息计算出其所属类别的区分度,再结合先验静态信息对模糊密度进行动态赋值。将该算法应用于人脸表情识别,实验结果表明,获得了较好的融合效果,提高了表情识别的准确率。
相关文章 | 多维度评价
8. 目标窗口尺寸自适应变化的Mean-Shift跟踪算法
林庆 陈远祥 王士同 詹永照
计算机应用    2009, 29 (12): 3329-3331.  
摘要1373)      PDF (661KB)(1213)    收藏
传统的窗宽尺寸固定不变的MeanShift跟踪算法不能实时地适应目标尺寸大小的变化。将多尺度空间理论与Kalman滤波器相结合,利用Kalman滤波器对尺寸变化的目标面积比例进行预测,用多尺度空间理论中的目标信息量度量方法求出前后相邻两帧的目标特征信息比,将其作为Kalman滤波器的观察值对目标面积比例进行修正,然后与MeanShift算法结合起来对目标进行跟踪,实验结果表明,改进的跟踪算法对尺度逐渐变大和变小的目标都能连续地自动地选择合适大小的跟踪窗口。
相关文章 | 多维度评价
9. 基于DM642的嵌入式疲劳驾驶监测系统的实现
王光娟 詹永照 刘志强
计算机应用   
摘要2314)      PDF (710KB)(1444)    收藏
针对基于DM642的嵌入式疲劳驾驶监测系统,讨论了系统的总体结构,提出了采用可控光源、奇偶差分帧和人眼跟踪的人眼检测方法。在与奇偶帧图像采集同步的内外圈光源的照射下,利用近轴光源的红眼效应,引起图像奇帧暗瞳孔、偶帧亮瞳孔,由奇偶差分帧快速实现人眼检测与跟踪。同时分析眼睛的特征参数,在一定时间内连续统计眼睛的闭合时间,计算眼睛累计闭合持续时间占某特定时间的百分率(PERCLOS)值来判断疲劳程度并报警。该系统疲劳监测准确率较高,可在汽车驾驶中进行实时疲劳驾驶监测。
相关文章 | 多维度评价
10. 面向语音增强的双复数卷积注意聚合递归网络
余本年 詹永照 毛启容 董文龙 刘洪麟
《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081. 2022101533
录用日期: 2022-12-28